استخراج ویژگی های زمانی- فرکانسی از سیگنال های گفتار فارسی جهت بهبود کارایی یک سیستم vad برای ارتباط انسان و ربات

thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده مهندسی برق
author فهیمه جمهوری
adviser حسین مروی علیرضا احمدی فرد
Number of pages: First 15 pages
publication year 1393

abstract

استفاده از ربات های اجتماعی در زندگی انسان ها افزایش یافته است و اصلی ترین راه ارتباط انسان ها با آنها ارتباط کلامی است. ربات های اجتماعی دارای میکروفونی هستند تا بتوانند سیگنال گفتار را برای ارتباط با انسان دریافت کنند. با توجه به دریافت نویز محیطی به هنگام ضبط گفتار انسان، نیاز به سیستمی برای تشخیص قسمت های گفتار در سیگنال های صوتی ضبط شده می باشد. هدف این پایان نامه طراحی یک سیستم آشکارساز فعالیت گفتاری است که بتواند با مشخص نمودن بخش های گفتار در یک محیط نویزی کارایی یک سیستم پردازش گفتار مورد استفاده برای یک ربات اجتماعی را افزایش دهد. در این پایان نامه، ویژگی های مختلفی جهت استخراج از سیگنال گفتار برای سیستم آشکارساز فعالیت گفتاری پیشنهاد شده است. این ویژگی ها با استفاده از ترکیب ویژگی انرژی با هر یک از ویژگی های ضرایب کپسترال فرکانس مل ریشه، ضرایب کپسترال فرکانس بارک، ضرایب پیش بینی ادراکی خطی و ضرایب پیش بینی ادراکی خطی تجدید نظر شده ارائه شده اند. روش پیشنهادی دیگری که در این پایان نامه مطرح شده بر مبنای ویژگی ویگنر ویل به عنوان یک روش استخراج ویژگی زمانی-فرکانسی است. این روش در مقایسه با روش های پیشنهادی مبتنی بر ویژگی انرژی و ویژگی های کپسترال، کارایی بهتری دارد. بنابراین برای افزایش کارایی روش های مبتنی بر ویژگی های کپسترال علاوه بر ویژگی انرژی، با ویژگی ویگنر ویل نیز ترکیب شده اند. برای ارزیابی کارایی روش های پیشنهادی، دادگان گفتاری فارس دات که یک پایگاه داده استاندارد و به زبان فارسی می باشد، به کار رفته است. با افزودن چند نوع متفاوت نویز به فایل های این پایگاه داده در شرایط مختلف نسبت سیگنال به نویز، مقاومت روش های پیشنهادی نسبت به نویزهای متفاوت سنجیده شده اند. آزمایشات نشان داده اند که برخی از روش های استخراج ویژگی پیشنهادی در این پایان نامه در مقایسه با روش متداول استخراج ویژگی ضرایب کپسترال فرکانس مل در محیطهای نویزی کارایی بهتری دارند.

Already have an account?login

similar resources

حذف خودکار آرتیفکت چشمی از سیگنال های مغزی با استفاده از ویژگی های آماری و زمانی- فرکانسی مولفه های مستقل

مهمترین مشکل در بررسی و پردازش ثبت های الکتروآنسفالوگرام (EEG) حضور انواع سیگنال های ناخواسته (آرتیفکت ها) است که حذف آنها با روش تحلیل مولفه های مستقل از بهترین گزینه های ممکن است. هدف مساله تحلیل مولفه های مستقل جداسازی کور ترکیبی خطی از منابع مستقل است. با اعمال این روش روی سیگنال های مغزی آغشته به آرتیفکت، آرتیفکت ها به صورت مولفه های مستقلی استخراج می شوند. تشخیص خودکار مولفه های مستقل مرب...

full text

استخراج ویژگی زمانی- فرکانسی جهت شناسایی دیداری مصوت های فارسی

در این پایان نامه روشی برای شناسایی مصوت های فارسی در کلمات تک سیلابی ارائه می شود. برای این منظور پس از جداسازی فریم های تصویر و انتخاب فریم هایی که مربوط به تلفظ مصوت موجود در کلمه تک سیلابی بودند و نیز استخراج ناحیه ای پیرامون لب ها، ویژگی های مختلفی همچون ضرایب کسینوسی و ضرایب موجک و ضرایب mfcc برای تشخیص مصوت ها در کلمات تک سیلابی استخراج گردید. پس از آن توسط روش کاهش ویژگی lsda، ویژگی ها ...

بهبود آشکارسازی مؤلفة P300 با استفاده از تلفیق روش‌های مختلف زمانی، فرکانسی و مکانیِ استخراج ویژگی

دراین مقاله سیستمی مبتنی بر بازشناسی آماری الگو جهت تفکیک سیگنال‌های حاوی P300 و فاقد آن، ارائه می‌شود. این سیستم- که بر روی دادگان P300-Speller مسابقات BCI 2005 کار می‌کند- از چهار بخش اصلی پیش‌پردازش، استخراج ویژگی، انتخاب ویژگی و طبقه‍بند تشکیل شده که تأکید اصلی این مقاله بر بخش استخراج ویژگی و بررسی کارایی ویژگی‌های مختلف است. در مرحلة استخراج ویژگی، شش دسته ویژگی شامل قطعه‌بندی هوشمند، ضرا...

full text

تشخیص لهجه های زبان فارسی از روی سیگنال گفتار با استفاده از روش های استخراج ویژگی کارآمد و ترکیب طبقه بندها

Speech recognition has achieved great improvements recently. However, robustness is still one of the big problems, e.g. performance of recognition fluctuates sharply depending on the speaker, especially when the speaker has strong accent and difference Accents dramatically decrease the accuracy of an ASR system. In this paper we apply three new methods of feature extraction including Spectral C...

full text

بهبود کیفیت گفتار مبتنی بر بهینه‌سازی ازدحام ذرات با استفاده از ویژگی های ماسک گذاری سیستم شنوائی انسان

چکیده: در این مقاله، روش‌های دوکاناله جدید زیرفضایی سیگنال با استفاده از تکنیک‌های حذف نویز ادراکی برای بهبود کیفیت سیگنال گفتار پیشنهاد شده‌اند. روش‌های پیشنهادی از مشخصات ماسک‌گذاری سیستم شنوایی انسان برای کاهش نویز باقیمانده قابلشنیدن بهره می‌گیرند. روش تجزیه به مقادیر منفرد کسری ادراکی، تکنیک بهینه‌سازی ذرات را برای تخمین نویز جمعی استفاده می‌کند. نتایج شبیه‌سازی دقیقی که توسط دو معیار مخ...

full text

استخراج ویژگی های مقاوم از سیگنال گفتار

در این پایان‎نامه دو روش استخراج ویژگی جدید که برای بازشناسی گفتار مفید است، ارائه شده است. ایده اصلی این پایان‎نامه، ارائه یک ساختار منعطف برای بانک فیلتر می‎باشد که به داده‎های آموزشی وابسته است. درحالی‏که سایر روش‎های استخراج ویژگی نظیر mfcc، ساختار بانک فیلتر ثابت و غیرمنعطفی را ارائه می‎دهند. برای پیاده‎سازی هر دو ایده، ابتدا، تعدادی فیلتر یکسان در نظر گرفته می‏شود. سپس، در روش اول، برمبنا...

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}

document type: thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده مهندسی برق

Keywords

استخراج ویژگی انسان ها آدمک آدمک اجتماعی بهبود عملکرد تابع ویگنر تعامل انسان آدمک توزیع وینگر ویل دامنه بسامد سیگنال گفتار ضریب مل کپسترال

Hosted on Doprax cloud platform doprax.com